Sandy Bridge – Timpul pentru „Tock” – Arhitectura
Sincer asteptam de mult Sandy Bridge, poate de prea mult timp circula informatii pe internet legate de noua arhitectura, noile performante, noile socket-uri…..aaa….stai putin….poftim? Noile socketuri? Pai abia incepusem sa ne obisnuim cu vechiul LGA atat 1156 cat si 1366. Ei bine intel s-a gandit ca e vremea pentru „Tock”! Pentru cei care nu isi mai aduc aminte intel a adoptat o politica numita „tick-tock” in functie de care lanseaza procesoare si tehnologii noi in acest domeniu.
Sandy Bridge vine de altfel cu multe surprize care pentru unii nu vor fi atat de placute. In primul rand overclockerii, mai ales cei care folosesc solutii de racire non standard vor avea ceva de comentat, apoi exista o atentie destul de mare indreptata asupra graficii integrate pe care Intel vrea sa o transforme intr-o alternativa la grafica dedicata, cel putin la desktopuri nu va fi cazul din fericire. Pe de alta parte codarea/decodarea video este un subiect la care noile procesoare exceleaza, o mica palma data producatorilor de placi grafice, iar procesul de fabricatie pe 32nm al noilor procesoare deblocate („Unlocked & Unleashed”) dupa cum scrie pe cutie permite o marja ceva mai ridicata de overclocking.
Tehnologia Clarckdale beneficia de cipuri diferite in acelasi pachet de siliciu. Unul dintre ele continea nucleele propriu -zise, interfata MCP (Multi Core Processing) si cache-ul, iar celalalt grafica integrata, controllerul PCI, PCI Express si de memorie.
Sandy Bridge ofera insa in acelasi pachet de siliciu toate functionalitatile unui procesor complex.
Sandy Bridge Core i7 2600K si Core i5 2500K
De la distanda tehnologia pare sa fie un castig de cauza imediat fata de vechiul predecesor. Ce mai trebuie mentionat este ca al doilea cip de la Clarckdale era pe 45 nm. Cu fiecare din procesoarele de generatie noua producatorul a avut in minte in singur lucru, integrarea a cat mai multe capabilitati intr-un singur cip, bineinteles si a cat mai multi tranzistori. Astfel maximul atinge aproape un miliard (995 de milioane ca sa fim cat mai la obiect) de tranzistori. La lansare exista deja mai multe modele de CPU-uri din nou putin diferit fata de aparitia procesoarelor LGA1156. Astfel avem varianta Quad-Core cu o suprafata de 216 mm patrati si cei 995 milioane de tranzistori, un dual-core cu 624 milioane de tranzistori si o suprafata a cipului de 149 mm patrati si varaintele mai ieftine cu o suprafata de doar 131 mm patrati ce contine doar 504 milioane de tranzistori. Atentie ne referim aici la dimensiunea interna a cipului nu a pastilei procesorului ce intra in contact cu sistemul de racire.
[table id=49 /]
Arhitectii de la Intel demonstreaza astfel cat de multi tranzistori au reusit sa inghesuiasca in noua arhitectura folosind si un spatiu ceva mai redus.
Nucleele lui Sandy Bridge
– Cred ca daca e sa caute cineva in acest articol de cate ori am folosit numele producatorului si al noii arhitecturi va ramane surprins, astfel voi folosi pentru arhitectura de acum incolo doar Sandy. Exista diferente si din punct de vedere al nucleelor fata de vechea generatie. Sandy dispune de 4 sau de 2 nuclee. Variantele cu 4 nuclee pot avea sau nu functia HyperThreading activa pe cand cele cu 2 nuclee o vor avea activata implicit. Pastrand nivelul de cache de 32KB L1 precum si cei 256 KB L2, de asemenea cache-ul L3, Sandy incorproreaza si un L0 care poate „tine minte” aproximativ 1500 de instructiuni. Acest L0 are rolul de a economisi energie si de a imbunatati viteza cu care CPU-ul se ocupa de instructiuni. Cache-ul are un rol foarte important in modul cum procesorul preia si executa aceste informatii. Fiecare nucleu al variantelor mai vechi de procesoare detinea acces separat la cache-ul L3. Seria de procesoare Xeon pentru servere foloseau alt tip de legaturi asemanator unui inel, care a fost preluat si de catre tehnologia Sandy Bridge. Astfel grafica integrata a procesorului foloseste de asemenea acelasi sistem. Latentele sunt foarte importante in acest caz insa cu alocarea accesului intr-un sistem de tip inel aceasta este foarte mica, fiecare nucleu putand lua cea mai scurta cale pana la cache-ul ce contine informatia dorita. Sper ca schema de mai jos sa va lumineze mai mult decat am incercat eu sa o fac.
Noua Functie Turbo Boost
Bine, nu este oficial noua sau nu poarta o altfel de denumire doar ca functioneaza putin altfel. La nucleele Lynnfield, dealtfel ca si la Sandy Bridge Turbo Boost profita de resursele nefolosite si le aloca altui proces in derulare pentru a termina task-urile mai repede. Acesta foloseste nivelul termic maxim programat pentru acel nucleu pentru a il accelera pana la acea limita. Diferenta insa este ca in lumea reala exista o diferenta de timp pana cand procesorul se incalzeste fizic si ajunge la maximul specificat, diferenta care acum este exploatata la maxim prin introducerea unui nou concept de rezistenta termica ce este mult mai precisa.
Diferenta astfel intre Lynnfield si noua generatie este ca la Sandy Bridge acest Turbo Boost va ramane mai mult activ pana cand se va atinge rezistenta termina maxima specificata, procesorul reducand apoi voltajul pentru a scadea temperatura. Avantajele nu sunt vizibile cu ochiul liber, cel putin nu la desktopuri, insa pentru segmentul de laptopuri poate fi o idee destul de apreciata, pe acel segment contand mai mult temperatura si viteza de raspuns. Ingenios este ca inginerii nu au facut rabat de la modificarea niciuneia din tehnologiile acestui procesor.
Extensiile AVX (Advanced Vector Extensions) este un lucru nou. Acest tip de instructiuni pe 256 biti vor fi suportate de asemenea de urmatoarele procesoare AMD (Bulldozer). In calculele cu virgula mobila acest tip de instructiuni sunt cele care conteaza, problema este ca aplicatiile din ziua de astazi nu suporta inca aceste instructiuni AVX, sau poate foarte putine programe destinate mediului industrial pot beneficia de ele. Producatorul are un scop insa bine definit, el stie ca pe viidor aplicatiile de grafica precum si cele de codare/decodare audio/video vor beneficia de acestea asa ca momentan este cu un pas inaintea competitorilor. Pam…pam pam pam pam.
Sandy Bridge Quick Sync
Da, stiu ca suna a program de sincronizare a smartphone-ului cu PC-ul insa nu la asta ma refeream. Tehnologia QuickSync nu este gandita de curand, mai exact in vara anului 2005!!! Mda, asta da secret bine tinut. Aceasta tehnologie a fost creata pe vremea in care Blu-Ray-ul isi facea aparitia pe scena IT-ului iar producatorii de film treceau si ei de pe SD pe HD. Tehnlogia la momentul respectiv era destul de slaba pentru editare HD iar intel si-a dat seama ca singura platforma de editare va fi computerul. La fel cum si producatorii de placi grafice au implemetat tehnologii de procesare precum CUDA si Stream (acum e numeste APP-Advanced Parallel Processing) insa ambele companii au incercat adaptarea tehnologiei paralele de procesare pentru codarea/decodarea video, insa nici una dintre ele nu au creat hardware nou dedicat pentru acest scop.
QuickSync este de fapt un procesor dedicat codarii/decodarii video pe care intel l-a inclus pe noile procesoare Sandy Bridge.
[table id=50 /]CyberLink MediaEspresso este unul din programele care au implementat deja suportul pentru cipul dedicat pentru video din noul procesor. Se pot vedea cred ca diferentele intre CUDA de la nvidia si Stream-ul de la ATI. Testul a fost facut cu un fisier de 1 GB 1080 convertit in format mov la o rezolutie de 1024×768. Rezultatele sunt absolut uimitoare. Cei doi producatori de placi video sigur s-au apucat de treaba si au inceput sa dezvolte un raspuns la QuickSync-ul lui intel pentru a nu pierde aceasta piata, insa in mod sigur va mai dura ceva pana vor veni cu ceva inovator.
Va asteptam in scurt timp sa cititi si urmatoarele articole despre arhitectura Sandy Bridge, testele efectuate pe multiple platforme si discutia despre cele doua tipuri de procesoare grafice integrate ale acestei noi tehnologii.